Data Analysis by R

Rによるデータ分析


Rを使ってデータ分析をするためのレシピ集です。

Rによるデータ分析について

環境と品質のためのデータサイエンス
R-EDA1によるデータ分析
Pythonによるデータ分析
Excelによるデータ分析

ウェブアプリR-EDA1
ウェブアプリR-QCA1

ENGLISH

データサイエンス教室

探索的データ分析

データ全体の可視化変数別の折れ線グラフヒートマップ

全変数間の類似度(量的)相関係数分析グラフィカルラッソ偏相関係数による有向相関分析有向相関偏相関分析正規化による有向相関分析有向比例分散分析相関偏相関散布図LiNGAM主成分分析の基本変数の類似度の主成分分析カーネル主成分分析しきい値主成分分析因子分析項目反応理論正準相関分析分解分析

全変数間の類似度(質的)ベイジアンネットワーク連関係数分析連関係数を使った主成分分析相互情報量相互情報量係数分析対数尤度情報量分析有向情報量分析累積寄与率連関係数質的変数の対数線形分析

1対多で変数の類似度(量的)変数の選択主成分回帰分析個別の因子の寄与率一般化線形混合モデル区間高次元化回帰分析ベクトル量子化回帰分析スプラインモデル木部分的最小二乗回帰分析

1対多で変数の類似度(質的)MT法混合分布MT法異常の近傍法分析ロジスティック回帰分析多項ロジスティック回帰分析ベクトル量子化ロジスティック回帰分析ベクトル量子化平均法

1対多で変数の類似度(両方)1対多のグラフ決定木N進木ランダムフォレスト隠れ変数の分析個々のサンプルの因果推論

カテゴリの類似度アソシエーション分析質的変数のコレスポンデンス分析個々のカテゴリの相関分析質的変数の主成分分析カテゴリの分解分析

サンプルの類似度(次元圧縮) 高次元データのネットワーク分析高次元を2次元に圧縮して可視化回帰分析系で高次元を2次元に圧縮して可視化サンプルの類似度の主成分分析

サンプルの類似度(クラスタリング)クラスタリングクラスタリングの原因分析クラスターの予測次元削減クラスタリング分析

サンプルの類似度(外れ値探索)外れたサンプルの探索

A-A型の分析距離行列の位置分析距離行列からの主成分分析距離行列のネットワーク分析ネットワークグラフ(非距離行列の分析)固有値分析無向グラフの固有値分析有向グラフの固有値分析可到達行列

A-B型の分析クロス集計クロス集計表の散布図分析2部グラフ分割表のコレスポンデンス分析クロス集計表の3部グラフクロス集計表の回帰分析行列の分解クロス集計表の主成分分析

テキストデータテキストマイニング

時系列データ準周期データの分析周期性のあるデータの分析時系列データの次元削減分析

検証的データ分析

検定違いの有無の分析正規性の分析対応のない2標本の類似度分析

推定予測区間の分析反実仮想因果効果分析

品質管理管理図ゲージR&R生存時間分析

Rでグラフを描く

標準グラフ機能ggplot2Plotlyパレート図

データの前処理

ダミー変換2進数変換1次元クラスタリングサンプルデータ欠損値の前処理内積とカーネル